from lxml import etree
import re

html = open('../素材/豆瓣.html', 'r', encoding='utf-8').read()
tree = etree.HTML(html)

li_list = tree.xpath('//ul[@class="cover-col-4 clearfix"]/li')

for li in li_list:
    #  获取封面
    print(li.xpath('./a/img/@src')[0])
    # 获取标题
    print(li.xpath('./div[@class="detail-frame"]/h2/a/text()')[0])
    # 获取评分
    print(re.sub('\s', '', ''.join(li.xpath('./div[@class="detail-frame"]/p[1]//text()'))))
    print(re.sub('\s', '', ''.join(li.xpath('./div[@class="detail-frame"]/p[2]//text()'))))
    print(re.sub('\s', '', ''.join(li.xpath('./div[@class="detail-frame"]/p[3]//text()'))))
    print("-"*100)
"""
re.sub 函数用于替换字符串中的匹配项。
'\s' 是一个正则表达式，匹配任何空白字符，包括空格、制表符、换行符等。
'' 是替换字符串，表示将匹配的空白字符替换为空字符串，即删除它
"""
